☰
9.6.3 판별기(Discriminator)를 활용한 전문가 행동과 에이전트 행동의 정렬
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 9. 모방 학습 (Imitation Learning): 전문가의 행동 복제
/
9.6 의도를 학습하다: 역강화학습 (Inverse RL)과 GAIL
/
9.6.3 판별기(Discriminator)를 활용한 전문가 행동과 에이전트 행동의 정렬
9.6.3 판별기(Discriminator)를 활용한 전문가 행동과 에이전트 행동의 정렬